(網(wǎng)經(jīng)社訊)01 產(chǎn)業(yè)鏈全景圖
02 AI大模型簡(jiǎn)介
02-1 什么是AI大模型?
大模型是擁有超大規(guī)模參數(shù)(通常在十億個(gè)以上)、復(fù)雜計(jì)算結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型,能夠處理海量數(shù)據(jù),完成各種復(fù)雜任務(wù),如自然語(yǔ)言處理、圖像識(shí)別等。
02-2 AI大模型的三大特征
02-3 AI大模型類型分析
02-4 算力承接算法及數(shù)據(jù),成為AI產(chǎn)業(yè)發(fā)展基石
在現(xiàn)代人工智能領(lǐng)域,算力扮演著推動(dòng)創(chuàng)新、實(shí)現(xiàn)突破的核心驅(qū)動(dòng)力。算力、算法、數(shù)據(jù)和系統(tǒng)架構(gòu)等多個(gè)方面的綜合優(yōu)化對(duì)于大規(guī)模模型訓(xùn)練的成功至關(guān)重要。從技術(shù)層面看,在大模型的研發(fā)過(guò)程中,預(yù)訓(xùn)練、微調(diào)和模型推理等環(huán)節(jié)是核心關(guān)鍵因素和主要計(jì)算特征。
03 上游產(chǎn)業(yè)鏈:算力、算法、數(shù)據(jù)
03-1 算力:驅(qū)動(dòng)智能的引擎
AI 大模型拉動(dòng)算力需求:預(yù)計(jì)2025 年,AI 大模型的算力需求將達(dá)2020 年 10倍,超 50% 源于企業(yè)AI 應(yīng)用。
AI 芯片市場(chǎng)格局與國(guó)產(chǎn)趨勢(shì):NVIDIA 占據(jù)全球高性能AI 芯片超80% 市場(chǎng),A100/H100 供不應(yīng)求,價(jià)格漲約3 倍。華為昇騰、寒武紀(jì)、壁仞科技等中國(guó)廠商加速自研,預(yù)計(jì)2025 年國(guó)內(nèi)AI 芯片市場(chǎng)份額升至30%。
云計(jì)算廠商的AI 算力競(jìng)爭(zhēng):2023年全球 AI云算力市場(chǎng)規(guī)模 640億美元,AWS、Azure、Google Cloud 占超70% 份額。阿里云、華為云、騰訊云等中國(guó)云廠商加速布局,阿里云計(jì)劃未來(lái)三年投524 億美元擴(kuò)充AI 算力。
AI算力服務(wù)商市場(chǎng)變化:產(chǎn)品及服務(wù)復(fù)雜性提升,推動(dòng)市場(chǎng)多樣性發(fā)展
03-2 算法:塑造思維的框架
算法是AI 大模型的核心要素,涵蓋深度學(xué)習(xí)框架與優(yōu)化策略。
Transformer 影響:2017 年Google 提出的Transformer 架構(gòu),掀起AI 大模型革命,成為技術(shù)基石,相較傳統(tǒng)RNN,計(jì)算效率提升超10 倍。
算法優(yōu)化與算力成本降低:AI 訓(xùn)練成本高昂,GPT - 4 訓(xùn)練成本估算超1 億美元。稀疏化、蒸餾、量化等新技術(shù)可使訓(xùn)練成本降低30% - 50%。
開(kāi)源與專有模型競(jìng)爭(zhēng)態(tài)勢(shì):
前沿算法發(fā)展動(dòng)態(tài) :2023 年多模態(tài)大模型(如GPT - 4V、Gemini)打破文本局限,可處理圖像、音頻、視頻等多種數(shù)據(jù)類型。強(qiáng)化學(xué)習(xí)(RLHF)優(yōu)化AI 交互能力,提升用戶體驗(yàn)。
算法的“從技術(shù)到應(yīng)用”:
數(shù)字經(jīng)濟(jì)時(shí)代迎來(lái)了數(shù)據(jù)的爆炸式增長(zhǎng),隨著大數(shù)據(jù)、云計(jì)算、人工智能等新型信息技術(shù)的加速發(fā)展及規(guī)模化應(yīng)用,數(shù)據(jù)的價(jià)值和地位不斷提升,已經(jīng)成為推動(dòng)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展的新型關(guān)鍵生產(chǎn)要素、重塑全球經(jīng)濟(jì)結(jié)構(gòu)、改變?nèi)蚋?jìng)爭(zhēng)格局的關(guān)鍵力量。
2024 年1 月,國(guó)家數(shù)據(jù)局發(fā)布《“數(shù)據(jù)要素X”三年行動(dòng)計(jì)劃(2024-2026 年)》,以政務(wù)、金融、互聯(lián)網(wǎng)、交電為代表的行業(yè)持續(xù)深化數(shù)據(jù)要素的發(fā)展與應(yīng)用,艾瑞咨詢預(yù)計(jì) 2024 年全年市場(chǎng)規(guī)模將達(dá) 1662.0 億元,2025 年市場(chǎng)規(guī)模將有望達(dá) 2042.9 億元。
從產(chǎn)業(yè)鏈價(jià)值環(huán)節(jié)傳導(dǎo)角度出發(fā),數(shù)據(jù)要素產(chǎn)業(yè)鏈分為數(shù)據(jù)資源要素化、市場(chǎng)化流通與數(shù)據(jù)要素應(yīng)用,這三大環(huán)節(jié)。首先,從數(shù)據(jù)采集歸類加工,管理后形成資產(chǎn),再加工為產(chǎn)品,完成數(shù)據(jù)資源要素化;再者,通過(guò)掛牌上市,或者場(chǎng)外交易的方式觸達(dá)各行業(yè)需求者并投入應(yīng)用。其中,再市場(chǎng)化流通這一環(huán)節(jié)當(dāng)中,也會(huì)有第三方服務(wù)機(jī)構(gòu),提供相應(yīng)地咨詢審計(jì)、評(píng)估與仲裁等服務(wù),更好地推進(jìn)數(shù)據(jù)資源化到應(yīng)用這一過(guò)程的轉(zhuǎn)化,所牽扯的參與方多元且類別復(fù)雜,價(jià)值共創(chuàng)屬性十分突出。
03-3 數(shù)據(jù):訓(xùn)練模型的燃料數(shù)據(jù)是AI大模型的基礎(chǔ)資源,涵蓋高質(zhì)量數(shù)據(jù)集與標(biāo)注信息。
數(shù)據(jù)質(zhì)量直接影響模型表現(xiàn):“Garbage In, Garbage Out”。根據(jù)研究,90% 的AI模型表現(xiàn)問(wèn)題來(lái)源于不良數(shù)據(jù)質(zhì)量,而非模型架構(gòu)。
多樣化的數(shù)據(jù)源提升模型的普適性:GPT-4結(jié)合文本與圖像數(shù)據(jù);Google的PaLM2模型集成了文本、圖像、音頻等多模態(tài)數(shù)據(jù),使其在多任務(wù)下表現(xiàn)更好。
前沿算法發(fā)展動(dòng)態(tài) :AI技術(shù)本身也可以用來(lái)加速數(shù)據(jù)清洗和預(yù)處理,例如自監(jiān)督學(xué)習(xí)、異常值檢測(cè)和自動(dòng)標(biāo)注技術(shù)。如,NLP領(lǐng)域常用的Tokenization和Embeddings
04 中游產(chǎn)業(yè)鏈:“百模大戰(zhàn)”
04-1 國(guó)際AI大模型對(duì)比
04-2 國(guó)內(nèi)AI大模型對(duì)比
05 下游產(chǎn)業(yè)鏈:AI + …… = ∞
05-1 AI 市場(chǎng)高景氣,大模型下游行業(yè)需求旺盛,應(yīng)用場(chǎng)景豐富2022年中國(guó)人工智能行業(yè)市場(chǎng)規(guī)模為3,716億人民幣,預(yù)計(jì)2027年市場(chǎng)規(guī)模將達(dá)到15,372億人民幣有望在下游制造、交通、金融、醫(yī)療等更多領(lǐng)域不斷滲透,實(shí)現(xiàn)大規(guī)模落地應(yīng)用
05-2 AI + 醫(yī)療
人工智能在醫(yī)療行業(yè)的應(yīng)用將帶來(lái)顛覆性變革,通過(guò)技術(shù)創(chuàng)新改變供給端和醫(yī)療工作流程,提高效率并催生增量市場(chǎng)。醫(yī)療資源供需矛盾突出,是推動(dòng)人工智能醫(yī)療發(fā)展的主要驅(qū)動(dòng)力,需求端因人口老齡化和健康意識(shí)提升而增長(zhǎng),供給端因資源不足和分布不均而難以滿足需求。人工智能在醫(yī)療影像、輔助診斷、新藥研發(fā)和健康管理等方向有廣泛應(yīng)用,其中醫(yī)療影像是成熟細(xì)分領(lǐng)域,手術(shù)機(jī)器人在輔助診斷中活躍,人工智能算法和算力優(yōu)勢(shì)助力新藥研發(fā),健康管理領(lǐng)域應(yīng)用廣泛。
05-3 AI + 金融
由于金融機(jī)構(gòu)往往具有信息安全要求高、數(shù)據(jù)處理量大且信息基礎(chǔ)設(shè)施建設(shè)較為完善的特征,人工智能技術(shù)得以較早在金融領(lǐng)域營(yíng)銷、合規(guī)、風(fēng)控等多元化場(chǎng)景實(shí)現(xiàn)落地應(yīng)用并得到長(zhǎng)足發(fā)展。
05-4 AI + 物流
06 發(fā)展趨勢(shì)
06-1 技術(shù)深化與融合多模態(tài)融合加速:未來(lái)AI大模型將更加注重多模態(tài)能力的融合,如文本、圖像、音頻、視頻等,以實(shí)現(xiàn)更豐富的應(yīng)用場(chǎng)景和更強(qiáng)大的交互能力。強(qiáng)化學(xué)習(xí)與人類反饋的結(jié)合:通過(guò)強(qiáng)化學(xué)習(xí)(RLHF)和人類反饋優(yōu)化,AI大模型將不斷提升交互能力和任務(wù)執(zhí)行的準(zhǔn)確性,進(jìn)一步縮小與人類智能的差距。算法優(yōu)化與效率提升:稀疏化、量化、模型壓縮等技術(shù)將不斷優(yōu)化,降低訓(xùn)練和推理成本,提高模型運(yùn)行效率,推動(dòng)AI大模型的普及化。
06-2 產(chǎn)業(yè)生態(tài)與商業(yè)模式變革MaaS模式興起:Model as a Service(MaaS)將成為主流商業(yè)模式,通過(guò)API接口提供大模型服務(wù),降低開(kāi)發(fā)門檻,激發(fā)新的產(chǎn)業(yè)鏈分工和商業(yè)模式。生態(tài)開(kāi)放性競(jìng)爭(zhēng)加?。簭S商將更加注重生態(tài)開(kāi)放性,通過(guò)開(kāi)源模型、開(kāi)放基礎(chǔ)設(shè)施、合作開(kāi)發(fā)等方式,構(gòu)建更廣泛的生態(tài)系統(tǒng),提升競(jìng)爭(zhēng)力。行業(yè)大模型定制化:針對(duì)金融、醫(yī)療、教育、工業(yè)等垂直領(lǐng)域的行業(yè)大模型將不斷涌現(xiàn),滿足特定行業(yè)的深度需求,推動(dòng)AI技術(shù)在更多領(lǐng)域的落地。
06-3 政策和倫理挑戰(zhàn)政策監(jiān)管加強(qiáng):隨著AI大模型的廣泛應(yīng)用,政府將加強(qiáng)對(duì)生成式AI、數(shù)據(jù)隱私、算法倫理等方面的監(jiān)管,推動(dòng)行業(yè)健康發(fā)展。倫理與可持續(xù)發(fā)展:廠商將更加注重AI技術(shù)的倫理合規(guī)性,推動(dòng)AI技術(shù)的可持續(xù)發(fā)展,確保技術(shù)應(yīng)用符合人類價(jià)值觀和社會(huì)利益。數(shù)據(jù)安全與隱私保護(hù):數(shù)據(jù)作為AI大模型的核心資源,其安全性和隱私保護(hù)將成為未來(lái)發(fā)展的重要挑戰(zhàn),廠商需要加強(qiáng)數(shù)據(jù)管理和安全技術(shù)的研發(fā)。